1
Definindo o Problema Padrão Convexo
MATH008Lesson 4
00:00

Um problema de otimização convexa na forma padrão é a base da programação matemática moderna. Ele é definido por uma função objetivo convexa $f_0$, restrições de desigualdade convexas $f_i$ e afim restrições de igualdade. Ao definir o problema sobre a interseção desses domínios $\mathcal{D} = \bigcap_{i=0}^m \text{dom } f_i$, garantimos que qualquer ótimo local seja um ótimo global.

1. Anatomia Matemática da Forma Padrão

O problema é formalmente expresso como:

$$\begin{aligned} &\text{minimizar} && f_0(x) \\ &\text{sob condição de} && f_i(x) \leq 0, \quad i = 1, \dots, m \\ &&& a_i^T x = b_i, \quad i = 1, \dots, p \end{aligned}$$

O conjunto viável é definido como $\text{dom } F = \{x \in \text{dom } f_0 \mid f_i(x) \le 0, i = 1, \dots, m, h_i(x) = 0, i = 1, \dots, p \}$. Um requisito crítico para convexidade é que as restrições de igualdade devem ser afins ($Ax = b$), pois igualdades não lineares geralmente resultam em conjuntos não convexos.

2. A Interpretação Geométrica do Epigráfico

O problema na forma epigráfica permite-nos interpretar a otimização geometricamente no 'espaço gráfico' $(x, t)$. Introduzindo uma variável de folga $t$, minimizamos $t$ sujeito a $(x, t) \in \text{epi } f_0$. Isso demonstra que o conjunto viável, qualquer conjunto subnível e o conjunto ótimo são intrinsecamente convexos.

3. O Engano entre Restrições Implícitas e Explícitas

Uma crença comum é que mover restrições para a função objetivo (tornando-as implícitas) simplifica o problema. No entanto, transformar as restrições em implícitas não tornou o problema mais fácil de analisar ou resolver, mesmo que o problema resultante seja nominalmente sem restrições. Isso é especialmente verdadeiro no modelo modelo Oracle (caixa-preta), onde avaliamos $f(x)$ e suas derivadas com um custo, sem conhecer a estrutura explícita.

4. Aplicações no Mundo Real

  • Teoria de Portfólio: Minimizando o risco $\text{var}(c^T x) = x^T \Sigma x$ para 4 ativos (por exemplo, Ativo 1 com retorno de 12%/desvio padrão de 20%).
  • Engenharia: Restrições estruturais como $y_i = 6(i - 1/3) \frac{F}{E w_i h_i^3} + v_{i+1} + y_{i+1}$.
  • Probabilidade: Restrições de risco de perda $\Phi^{-1}(\beta) \leq 0$.
🎯 Princípio Central
A condição de otimalidade para uma $f_0$ diferenciável é dada por $\nabla f_0(x)^T(y - x) \geq 0$ para todo $y$ viável. Isso implica que o gradiente deve ser um hiperplano de apoio ao conjunto viável no ponto ótimo.